通用AI的普及,正对通信网络带来新的机会与挑战。通信网如何迎接这个“杀手级”应用?
智能化的本质,就是以数字化为基础,以数据驱动,最后迈向应用智能化的过程,其细节都建立在ICT基础设施的迭代之上,那么,作为网络基础设施,通用人工智能的发展,对于基础网络又提出了哪些新的需求和挑战?
AGI推高网络等级
ChatGPT本质是OpenAI公司语言大模型的一种前端应用形态,凭借背后大语言模型的智慧储备,ChatGPT才能进行快速、流畅的连续对话,逐渐演进出写代码、写小说等生产力环节。
当前,ChatGPT的出圈不断带动了大模型的爆火,相比于小模型数据有限、能力有瓶颈,定制化、碎片化情况严重,以及缺乏规模化复制和涌现能力,AI大模型则具备多个场景通用、泛化和规模化复制等诸多优势,也被视为是实现AGI的重要方向。
在记者看来,AI大模型就是“大数据+大算力+强算法”结合的产物,而AGI则是AI大模型递进的最终形态。AI大模型具有很高的计算和存储需求,以OpenAI的GPT系列,最初的GPT-1拥有1.17亿个参数,到GPT-3的参数已经到达1750亿个,目前的GPT-4虽没有给出具体的参数量,业界也预估其参数以接近万亿,夸张的计算量背后,AI产业不仅需要使用极为强大的计算设备和高效的算法才能训练和应用,可靠的网络传输也成为关键。
首先,通用大模型的训练需要大量的计算资源和数据,这导致了通信网络的速率要求大幅提高,特别是在分布式训练场景中,各个节点之间需要频繁地传输数据,网络速度直接影响了模型的效率和性能。
其次,相比于一般的传统运算,AI运算往往计算逻辑更为复杂,还夹杂着如图像、视频等更高数据量的信息,对网络的的带宽也提出了新的要求。
最后,在AI运算场景中,以太网每1%丢包率的增加,对AI应用的实际算力发挥都将产生极大影响,网络的可靠性进一步凸显。
目前,针对通用大模型对通信网络的挑战,业界已经采取了一些措施。如在模型训练过程中将模型拆分成多个小模型,每个小模型在不同节点上进行训练,从而减少了数据传输的需求,或在模型推理方面,采用更简化的推理算法,来减少计算和存储的压力,同时还可以采用更好的数据压缩算法来减少数据传输量。
值得一提的是,尽管AI驱动的网络安全不断向前发展,但许多安全专业人员仍认为,人类智能仍将是根据具体情况提供最佳结果,据《人工智能与人类要素安全情感研究》表明,60%的安全专业人员仍然对由人类验证的网络威胁结果比人工智能生成的结果更有信心,其中大约三分之一的受访者表示,直觉是推动人类分析的最重要的人为因素,21%的人认为创造力是人的优势,20%的人认为以前的经验和参考框架是使人们对安全操作流程至关重要的因素。
可见,面向非线性发展的AI产业,对于网络环境来说,今天更大的任务是要适应企业用户不断增大的AI算力需求,以及衍生的网络依赖,网络环境必须为AI任务大量普及,提供必要的网络支持,不能等到数据泛滥,深度学习应用迫在眉睫,才发现原来路还没铺好,从传统尽力而为的网络环境,算力网络正在推动AI产业进入发展快车道。
算力:从约束到自由
通信行业运营商作为国家信息通信基础设施建设者和运营者,也是让大模型实现普惠智能服务的承载者。然而,随着摩尔定律的逐步放缓,数据中心、边缘节点、智能终端等单点算力正在面临瓶颈。以5G为代表的通信基础设施和以云计算为代表的信息基础设施的高质量发展,为网络与算力融合提供了基础条件。
在算力作为数字经济的关键生产力,已形成新的全球竞争格局的状态下,我国通信行业率先提出了算力网络技术并主导了这一新型信息通信基础设施的发展建设,在产业方面已初步形成算力网络软硬件基础设施及平台与应用服务的上中下游完整产业链。
2022年2月,“东数西算”工程正式全面启动。据国家发改委消息,截至目前,“东数西算”工程中,8个国家算力枢纽节点已全部开工,“东数西算”从系统布局进入全面建设阶段。工信部数据也显示,通过统筹布局数据和算力设施,2022年底全国在用数据中心机架总规模超过650万标准机架,算力总规模近五年年均增速超过了25%。
作为数字信息基础设施建设的国家队和主力军,三大运营商正加快算力基础设施建设和投资。其中,中国联通建设了“5+4+31+X”新型数据中心体系;加快京津冀、长三角、粤港澳大湾区、成渝区域4个东数枢纽节点的高等级数据中心建设;建设蒙贵甘宁4个西算枢纽节点。
中国移动持续优化“4+N+31+X”数据中心布局,匹配枢纽节点,算力规模达到8EFLOPS,可对外服务数据中心机架数投产达35万架,实现全国一级算力资源池互联互通,构建全国20ms、省域5ms、地市1ms时延圈,云专网覆盖304个地市,省际骨干网带宽超过800Tbps。
中国电信统筹云、网、数、智、安及平台等多要素算力需求,持续优化“2+4+31+X+O”的泛在算力基础设施布局,规模建设京津冀、长三角、粤港澳、成渝等区域中心节点。
联通数科首席AI科学家廉士国指出,通用智能的研发和应用在离线训练开发、在线推理应用、在线自主持续学习三大阶段对对算网的需求都有所不同,既需要算网融合体系的支撑,除了对算力规模和网络带宽等要求外,还需要云、边、端部署方式的协同。
事实上,算力网络的内涵就是要以网调算、以网融算、以网强算,通过网络对算力的感知、触达、编排、调度能力,在算网拓扑的任何一个接入点,为用户的任何计算任务可灵活、实时、智能匹配并调用最优的算力资源,从而实现云-边-端任何时间与任何地点的多方算力需求。
对此,有相关专家认为,基于算力网络对先进算力进行集中化建设使用和集约化发展,提升大模型构建和使用的算力能效,为大模型普惠智能服务提供高效基础支撑,也是在先进半导体面临严格管制的情况下通信行业节约算力投资、提升计算产业安全的重要举措。
为杀手级应用服务
除进一步提升模型性能和扩展应用场景外,如何大幅降低大规模复杂模型的学习能耗和时间成本,也是实现通用人工智能需要冲破的瓶颈所在,5G网络边缘侧和终端侧所存在的大量分散算力资源有待进一步整合挖掘。因此,如何在网络边缘通过协同支持通用AI模型的学习推理,实现AI超高计算需求与边缘分散通信、与计算能力间的灵活高效适配,推动后5G时代乃至6G时代的“边缘智能”和“内生智能”,将是重要发展方向。
目前,我国已建成全球规模最大、技术领先的网络基础设施。截至2022年底,已累计建设开通5G基站231万个,千兆光网具备覆盖超过5亿户家庭的能力;移动物联网连接数首次超过移动电话用户数,成为全球第一个实现“物超人”的国家。
“5G+工业互联网”加速融合,典型应用场景已在采矿、电力、钢铁等22个国民经济重点行业推广,支撑实体经济降本提质增效。人工智能赋能制造业数字化转型,以机器视觉、数字孪生工厂、工业机器人、智能巡检、智能监测等为代表的智能工厂建设,以产业大脑实现行业网络化协同、个性化定制、服务化延伸等新模式新应用以及打造智能供应链、产业链等已在多个行业落地,并以极快的速度探索前沿应用。
廉士国指出,以大模型为基础的应用会更加普及,这给集中化部署的大模型MaaS带来挑战,例如服务并发能力、出口带宽问题等。为减轻支撑大量用户并发服务的压力和提升性价比,将推理算力分散化做并行分布式部署和协同,并尽量向边缘侧下沉,是趋势。
据悉,《“十四五”数字经济发展规划》提出加快建设信息网络基础设施,对5G与AI在通信基础设施建设层面的融合提出需求。同时,推进云网协同和算网融合发展,需要在5G网络能力建设方面,提升数据中心跨网络、跨地域数据交互能力,加强面向特定场景的边缘计算能力,强化算力统筹和智能调度,以实现面向政务服务、智慧城市、智能制造、自动驾驶、语言智能等重点新兴领域提供体系化的人工智能服务,这进一步明确了5G和AI融合的应用场景与发展方向。
在廉士国看来,人工智能的布局方式可能是端侧,主要部署局部智能,具备某方面垂直智能能力,例如工业品质检,个性化强、使用频次高;边缘,主要部署个人智能,具备通用智能能力,如ChatGPT这样类人的多才多艺,会自主迭代成长;云上,主要部署群体智能,具备超级智能能力,例如集合众人之长的超级能力,会集合多个“个人”的共性,训练更新频次相对较低。这些不同层级的智能有机融合进算网体系的相应环节中,形成算网智能体。
面向AI时代,所有产品都值得重做一次。同样,普适AI的到来,也值得通信网络重构一次。
指导:新文
推荐阅读